Learning Dexterous In-Hand Manipulation
ロボットハンドで立方体を回転させる
OpenAI 2018
実環境の完全なモデル化は不可能
Domain Randomization
考えうるすべてをランダム化(個別?同時?)
長さ,重さ,摩擦係数, 観測誤差, 制御誤差, 遅延, オブジェクトに加わる力, カメラの位置, 照明の設定, ハンドとオブジェクトの位置・向き・テクスチャ,...
ランダム化ありとなしでは実世界でのテスト成功率に大きな差
Asymmetric Actor-Critic
PPO
実験設定
Shadow Handを使用
入力設定1:モーションキャプチャした姿勢
LEDマーカにより指5本と立方体をキャプチャ
実環境での追加学習無しで平均20連続回転
入力設定2:3つのカメラ画像
RGBカメラ3台
同平均15連続回転
計算資源
8 NVIDIA V100 GPUs
6144 CPU cores
50 hours
https://gyazo.com/99381ea84aaa2d59d5b8b074b110d8bd